查看原文
其他

机器翻译译后编辑 | 《劳特里奇翻译技术34章-机器翻译译后编辑》文献推介 (中)


POST-EDITING OF MACHINE TRANSLATION
机器翻译译后编辑
作者:李梅本篇文献摘自Routledge Encyclopedia of Translation Technology (2nd Edition),是该书第三部分的第34篇。

书籍链接

https://www.routledge.com/Routledge-Encyclopedia-of-Translation-Technology/Sin-wai/p/book/9780367767365#


作者简介

李梅,同济大学教授,留英博士、博士生导师。同济大学校务委员会委员、上海市科技翻译学会副理事长、上海市科协常务理事、中国译协理事、上海市杨浦区语言文字协会副会长、美国ETS中国唯一官方导师、《上海翻译》编委、《同济大学学报》(社科版)编委。近年来完成或正在进行的国家社科、教育部等省部级及以上(含联合国项目)科研项目8项。在《外语教学与研究》、《现代外语》、《中国翻译》等核心期刊上发表学术论文数十篇,出版专著、译著四部。

译后编辑的生产率


人们认为将机器翻译系统纳入翻译过程中会提高生产率。然而,机器翻译的输出就像是一种不完整或未完成的翻译半成品,需要进一步编辑才能使其成为准确且连贯的翻译。与上个世纪从零开始的人工翻译相比,人们很少进行测试或实验来估计译后编辑的生产率(Allen 2003)。早期的译后编辑研究主要涉及验证译后编辑是否确实比传统的人工翻译更快。但是,由统计机器翻译(SMT)产生的初始翻译目标文本,以及SMT之前的规则机器翻译(RMT),都未能达到节省译后编辑时间和降低翻译成本的目的。21世纪初,自神经机器翻译(NMT)问世以来,情况才有所改观。如今,NMT的翻译质量已不可同日而语,很多学者的研究兴趣集中在通过实证研究来测试学术界和行业内的译后编辑生产率。这些实验的研究结果表明,译后编辑的生产率收益大于损失(Plitt和Masselot 2010;Kovačević 2014;Daems et al. 2017)。近年来,越来越多的研究探讨了译后编辑过程,来检验与生产率有关的问题,例如,译后编辑与从零开始翻译的速度比较,通过译后编辑与人工翻译的材料数量对比,以及译后编辑可达到的质量(Plitt和Masselot 2010;Carl, et al 2011;Koponen和Salmi 2015)。以下是一些案例,展示了与生产率测试相关的实验。

在2002-2005年间,六名专业翻译参与了为期八个月的国际研究项目TransType2。任务要求他们使用TransType把词数为2000-2500个单词的英语文章翻译成西班牙语、德语和法语,并进行五轮以上的译后编辑。研究报告指出,他们在第四轮的最佳表现是每分钟16.75个单词,每小时1005个单词。相较于人工翻译,机器翻译译后编辑的平均生产率提高了20%(Macklovitch 2006)。在2009年的另一项实验中,利用LISA QA模型和GALE译后编辑指南组合成新的分类方法,对六名英语—法语和英语—西班牙语的译后编辑人员所做的编辑更改进行了分类。他们推断出译后编辑的生产率,预计平均每天能够翻译5000个单词,而计算出最快的两名译后编辑者实际生产率每天高达9600和8592个单词。与通常人工翻译预期的平均生产率(每天在2000到2500个单词之间)相比,这些推断出的生产率值要高得多(Almeida和O’Brien 2010)。Guerberof(2009)在一项实验中测出机器翻译译后编辑生产率和质量相较于人工翻译平均生产率提高了13%到25%。不仅如此,机器翻译的速度比人工翻译快了16%,译后编辑速度为每分钟13.86个单词,而人工翻译从头开始的速度为每分钟11.87个单词。这相当于译后编辑每小时831.6个单词,而人工翻译每小时712个单词。这些实验获得的数据为译后编辑生产率,特别是速度方面的提高提供了坚实的证据。在所有实验中,译后编辑后的文本应该达到人工翻译所期望的质量标准。

这些研究结果具有重要意义,因为现在普遍认为,高质量的机器翻译译后编辑可以节省时间、降低翻译成本,而不损害翻译的质量,从而提高生产率,尤其是在技术领域(Plitt和Masselot 2010;Zong 2020)。相反,对质量较低的机器翻译内容进行译后编辑将耗费更多时间和精力,甚至比人工翻译更加耗费精力(Guerberof 2009;García 2010;Specia 2011;Koponen 2012, 2016)。另一方面,研究结果表明译后编辑比人工翻译要快,但并不总是明显如此(Carl等人 2011;García 2011;Daems等人 2017)。研究人员还指出,生产率数据受多种不确定因素的影响,包括译后编辑者的经验、项目的性质、源文本的类型和语言对,以及机器翻译系统本身(Guerberof 2009, 2010;García 2011)。


多年来,译后编辑的生产率已经通过客观和主观方法以及多样化的方法进行了测量。Allen(2003)预测,易于使用的译后编辑工具可能会成为翻译生产率的助推器。随着译后编辑工具的不断发展,这一预测已经成为现实,这些工具要么集成到文字处理系统中,要么作为独立工具存在。正如Groves和Schmidtke(2009)所报道的,微软开发了一种基于译员记录时间的方法,用于追踪Microsoft的Treelet机器翻译引擎(Quirk等人 2005)的生产率,目的是使他们的翻译系统和译后编辑者都受益。他们获得了一系列与数据相结合的实验结果,其中一部分显示在表34.3和34.4中。设计标准的动态编程技术来计算机器翻译和译后编辑的字符串之间的编辑距离(将在本章后面详细探讨),以评估生产率(Levenshtein 1965)。


微软的研究结果表明,随着翻译人员对机器翻译和译后编辑越来越熟悉,机器翻译的质量会随着时间的推移而提高,相关的生产率也会随之提高。如表34.3所示,这些改进使生产率从6.1%(捷克语)提高到28.6%(丹麦语),具体取决于所选语言。如表34.4所示,通过对译后编辑过程中所做更改的可量化数据进行分析,通过这种追踪方法获得了对微软改进其机器翻译系统以及评估机器翻译在特定项目中适用性的有用信息。它也加强了对译后编辑成功的理解。


表34.3


表34.4


2014年,Guerber进行了一项关于在SurveyMonkey平台上对译后编辑生产率感知的调查。他招募了一组24名译员和3名审校员,让他们完成一份调查问卷。根据他的研究结果,40%的参与者报告称在使用译后编辑时,他们的生产率随时间增加,而45%的参与者则表示他们的生产率随时间保持不变。随着他们译后编辑的经验增加,55%的参与者更容易发现机器翻译的错误,而30%认为他们的经验对他们的生产率没有任何影响。当被问及译后编辑的付出时,30%的参与者认为机器翻译译后编辑需要与检查人工翻译一样的付出,40%的参与者认为生成的文本比检查人工翻译需要更多的工作,只有20%的参与者认为对机器翻译进行译后编辑比检查人工翻译需要更少的工作。

Daems等人(2017年)进行了一项实验,通过眼动追踪和按键记录来记录译后编辑过程,从而更深入了解学生译员和专业译员对一般文本类型的机器翻译译后编辑中的翻译速度、认知负荷以及使用外部资源情况。他们得出结论,译后编辑不仅在技术文本方面(正如Plitt和Masselot在2010年的研究中所提出的),在一般文本类型方面也在统计上显著快于人工翻译。然而,在速度方面,学生和专业译员之间并没有发现显著差异,这与Jääskeläinen(1996年)的观察一致,即专业译员不一定比学生翻译更快。此外,他们发现除了速度之外,还要考虑译后编辑的认知方面,因为即使译后编辑在速度上胜过人工翻译,如果它在认知上更具挑战性,译后编辑人员会比从头开始进行常规翻译的译员更早疲劳,这将导致长期内生产率下降。
本章作者正在做一项研究,旨在衡量译后编辑的生产率,以帮助语言服务提供商制定译后编辑定价策略,这是长期以来困扰提供商和客户的问题。在这项研究中,生产率以编辑距离、认知负荷和加工难度这三个维度来计算,其中编辑距离通过优化常规机器翻译评估指标(如BLEU、Meteor和TER)的结果来实现;认知负荷通过眼动追踪和按键记录来估计;而加工难度则通过分析译后编辑错误模式来评估。从编辑距离、认知负荷和加工难度收集的数据来制定三个函数,来确定它们之间的相关性。其中,加工难度是基于早期针对从英语到汉语的译后编辑错误分析的研究(Luo和Li 2012; Li和Zhu 2013a)来考察的,通过识别机器翻译错误模式来帮助开发自动化译后编辑工具。在这项研究中,使用了来自汽车维修手册的10万条英汉句对,通过比较原始机器翻译输出和译后编辑版本来检测机器翻译错误,将这些错误分为词汇、句法和打字输入类错误三类。词汇类别进一步分为七个子类,包括术语、缩写和连接词等,而句法类别进一步分为七个子类,包括词序、动词短语和不定式等。基于错误模式分析的统计数据显示,词汇错误高达70.84%,句法错误为26.84%,打字输入类错误为2.32%,其中有42%的词汇错误涉及术语,35.84%的句法错误涉及词序(Li和Zhu 2013b)。这项研究结果揭示了在修正机器翻译译文时,译后编辑员在译后编辑过程中付出的努力以及他们在进行译后编辑修改时可能遇到的不同难度水平。
一般来说,生产率的提升或降低主要与时间和质量密不可分,前者决定了译后编辑的速度,而后者塑造了最终的翻译产品。在这个阶段,有必要提到微软提出的著名的“2秒决策基准”(2-second decision benchmark),用于分析和衡量译后编辑的生产率。根据这一基准,译后编辑员需要在2秒内决定机器翻译输出的文本是否适合译后编辑;否则,生产率提升就不成立。实施这一基准的可行性仍存在争议,因为一开始看起来似乎是不可能的,尽管这一基准是微软进行了长达十年的机器翻译研发项目的结果,为今天的Microsoft Translator服务铺平了道路。感兴趣的读者可以参考TAUS关于Microsoft Translator的技术简报(TAUS 2010: 30)。
请注意,在我们之前的讨论中,生产率中的质量大多被忽视了。实际情况是,在计算生产率时,质量大多是与时间分开进行衡量的。接下来的问题是,机器翻译译后编辑的质量是否与人工翻译的质量一样好,能够满足客户期望。Koponen和Salmi(2017年)进行的一项关于译后编辑质量的实验显示,9%的译后编辑是不正确的,而剩下的91%是正确的,其中61%需要更正,38%不需要更正。不正确更正和不必要更正总共占了47%。这个令人担忧的数字是否会影响机器翻译译后编辑的质量可信度?如果译后编辑未能提供与人工翻译相媲美的译文质量,那么机器翻译所带来的潜在生产率提升将会受到损害。如何在生产率测量中妥善考虑质量显然是学界和行业应更加关注的问题。在测量译后编辑生产率时,如何进行质量评估值得更多关注。
近年来,随着对研究过程的日益关注,译后编辑工作的转变日益显现出来(Ortiz-boix和Matamala 2016;DePalma等2019)。研究人员特别关注人类认知努力,因为他们认为深入了解长期影响译后编辑生产率的因素至关重要,他们相信这将有助于洞察人类思维,从而增进对这些因素的深入了解。译后编辑工作的努力测量具有重要意义,因为它不仅有助于识别翻译难度,还有助于译后编辑定价(Vieira 2014),如果没有译后编辑的定价,译后编辑将永远无法作为独立的翻译替代品得以实现。

以上摘译内容为本篇文献的中间部分,后续请继续关注《机器翻译译后编辑》文献推介(下)。



END


特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

翻译技术教育与研究——机器翻译译后编辑专题组致力于普及机器翻译译后编辑(MTPE)相关知识,追踪国内外机器翻译译后编辑教学与研究动态!

推文编辑:谈津雷 梁鑫茹

指导/审核:肖志清  王雪红

项目统筹:李鸣晨


▶ MTPE专题推文机器翻译译后编辑 | 《基于神经机器翻译的科技文本译后编辑模式研究》文献推介机器翻译译后编辑 | 人工智能时代的译后编辑能力研究机器翻译译后编辑 | 《译后编辑及其研究简史》文献推介机器翻译译后编辑 | Lynne Bowker机器翻译素养机器翻译译后编辑 | 《ChatGPT时代机器翻译译后编辑能力培养模式研究》文献推介机器翻译译后编辑 | 《国际机器翻译译后编辑认知研究路线图(2011—2021)》文献推介机器翻译译后编辑 | 《译后编辑的能力结构与课程设置——基于国外译后编辑课程的前沿分析》文献推介机器翻译译后编辑 | 《翻译修改与译后编辑》书籍推介2机器翻译译后编辑 | 《翻译修改与译后编辑:行业实践和认知过程》书籍推介机器翻译译后编辑 | A short guide to post-editing 书籍推介 9机器翻译译后编辑 | 《机器翻译译后编辑》文献推介 (上)机器翻译译后编辑 | A short guide to post-editing 书籍推介 8机器翻译译后编辑 | A short guide to post-editing 书籍推介 7机器翻译译后编辑 | A short guide to post-editing 书籍推介 6机器翻译译后编辑 | A short guide to post-editing 书籍推介 5 机器翻译译后编辑 | 《人工智能辅助译后编辑新方向——基于ChatGPT的翻译实例研究》文献分享机器翻译译后编辑 | A short guide to post-editing 书籍推介 4机器翻译译后编辑 | A short guide to post-editing 书籍推介 3机器翻译译后编辑 | 《机器翻译视角下的翻译本质》文献分享机器翻译译后编辑 | A short guide to post-editing 书籍推介 2机器翻译译后编辑 | A short guide to post-editing 书籍推介 1



继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存